由於URL對於爬蟲是相當重要的,在進入爬蟲的世界前,先來聊聊URL~
表示網站位置,也就是網址
架構
細一點來看,舉it鐵人的網址為例
https://ithelp.ithome.com.tw/users/20162596/ironman/6637?index1=1&index2=2
https://ithelp.ithome.com.tw/users/20162596/ironman/6637?index1=1&index2=2
→URL
https
→ 通訊協定
ithelp
→ 主機名稱
ithome.com.tw
→ 網域名稱
ithome
→ 次級網域.com.tw
→ 頂級網域users/20162596/ironman/6637
→ 檔案路徑
index1=1&index2=2
→ 參數
好的網址,能讓使用者一看到網址就可以快速了解網頁連結的內容!
而且人們相較於廣告,更相信搜索排名。
因此將搜尋引擎最佳化(也就是SEO網址優化),是會大大影響曝光度跟可信度的。
在URL設定中可以注意下列事項:
經營網站時,使用免費網域是風險很高的
畢竟是用心經營的網站,有天使用權被收回了,大概心會淌血
因此若要認真經營網站,建議購買自己專屬的網域!
(聽說資工系人人一網域不知道是不是真的XD)
WHOIS可以查到全世界的域名資料,其中還包含很多細項,連網域到期日都有,有興趣可以去看看~
國內可以向中華電信、網路中文等網域公司購買。
而向國內的網域公司購買有些好處
等我買完再來分享心得~
簡單聊完URL,下次來聊HTTP 傳輸協定,那我們明天見~